Aller au contenu

Machine d'apprentissage logique

Un article de Wikipédia, l'encyclopédie libre.

Machine d'apprentissage logique (en anglais Logic learning machine, LLM, à ne pas confondre avec Large language model) est une méthode d'apprentissage automatique basée sur la génération de règles intelligibles. LLM est une implémentation efficace du paradigme du réseau neuronal à commutation (en anglais Switching Neural Network, SNN, à ne pas confondre avec Spiking Neural Networks, SNNs)[1], développé par Marco Muselli, chercheur principal au Conseil national italien de la recherche CNR-IEIIT à Gênes.

LLM a été employé dans de nombreux secteurs différents, notamment le domaine de la médecine (classification orthopédique des patients [2], analyse de puces à ADN [3] et systèmes d'aide à la décision clinique [4] ),les services financiers et la logistique.

Le paradigme de réseau neuronal à commutation (Switching Neural Network) a été développée dans les années 1990 pour surmonter les inconvénients des méthodes d’apprentissage automatique les plus couramment utilisées. En particulier, les méthodes de boîte noire, telles que le perceptron multicouche et la machine à vecteurs de support, avaient une bonne précision mais ne pouvaient pas fournir un aperçu approfondi du fonctionnement interne de l'apprentissage étudié. En revanche, les arbres de décision étaient capables de décrire le phénomène mais manquaient souvent de précision. Les réseaux de neurones à commutation ont utilisé l'algèbre booléenne pour construire des ensembles de règles intelligibles capables d'obtenir de très bonnes performances. En 2014, une version efficace de Switching Neural Network a été développée et implémentée dans la suite logiciel de l'entreprise Rulex sous le nom de Logic Learning Machine[5]. De plus, une version LLM consacrée aux problèmes de régression a été développée.

Comme d'autres méthodes d'apprentissage automatique, LLM utilise des données pour construire un modèle capable d'effectuer une bonne prévision sur les comportements futurs. LLM part d'une table comprenant une variable cible (sortie) et quelques entrées et génère un ensemble de règles qui renvoient la valeur de sortie correspondant à une configuration donnée d’entrées. Une règle s'écrit sous la forme :

où la conséquence contient la valeur de sortie alors que la prémisse inclut une ou plusieurs conditions sur les entrées. Selon le type de saisie, les conditions peuvent prendre différentes formes :

  • pour les variables catégorielles, la valeur d'entrée doit être dans un sous-ensemble donné : .
  • pour les variables ordonnées, la condition s'écrit sous forme d'inégalité ou d'intervalle : ou

Une règle possible est donc sous la forme:

Selon le type de sortie, différentes versions de Machine d'apprentissage logique ont été développées :

  • LLM pour la classification, lorsque la sortie est une variable catégorielle, qui peut prendre des valeurs dans un ensemble fini
  • LLM pour la régression, lorsque la sortie est un nombre entier ou réel.

Références

[modifier | modifier le code]
  1. Muselli, « Switching Neural Networks: A new connectionist model for classification », WIRN 2005 and NAIS 2005, Lecture Notes on Computer Science, vol. 3931,‎ , p. 23–30 (lire en ligne)
  2. Mordenti, Ferrari, Pedrini et Fabbri, « Validation of a New Multiple Osteochondromas Classification Through Switching Neural Networks », American Journal of Medical Genetics Part A, vol. 161, no 3,‎ , p. 556–560 (PMID 23401177, DOI 10.1002/ajmg.a.35819, S2CID 23983960)
  3. Cangelosi, Muselli, Blengio et Becherini, « Use of Attribute Driven Incremental Discretization and Logic Learning Machine to build a prognostic classifier for neuroblastoma patients », Bits2013, vol. 15, no Suppl 5,‎ , S4 (PMID 25078098, PMCID 4095004, DOI 10.1186/1471-2105-15-S5-S4)
  4. Parodi, Filiberti, Marroni et Montani, « Differential diagnosis of pleural mesothelioma using Logic Learning Machine », Bits2014, vol. 16, no Suppl 9,‎ , S3 (PMID 26051106, PMCID 4464205, DOI 10.1186/1471-2105-16-S9-S3)
  5. « Rulex: a software for knowledge extraction from data », Italian National Research Council (consulté le )

Liens externes

[modifier | modifier le code]